隨機森林是由多棵昨天提過的決策樹組成,適合用在分類問題
由很多顆決策樹組成,他會先從原資料中隨機抽取多個樣本,用這些樣本以隨機特徵選取的方式建立多棵決策樹,最後由所有決策樹加權投票決定結果
from sklearn.ensemble import RandomForestClassifier
for a in np.arange(30, 71, 10):
for b in np.arange(300, 701, 100):
forest=RandomForestClassifier(max_depth=a,n_estimators=b,n_jobs=-1, random_state=0)
clf = forest.fit(X_train,y_train)
print(clf.predict(X_test))